获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
An empirical analysis of compute-optimal large language model training
我们问一个问题:“对于给定的计算预算,最佳模型大小和训练令牌数量是多少?”为了回答这个问题,我们训练了各种大小和各种标记数量的模型,并根据经验估计了这种权衡。我们的主要发现是,当前的大型语言模型对于其计算预算来说太大了,并且没有在足够的数据上进行训练。